回到首頁
伺服器磁碟陣列(RAID)-本機的儲存系統
-
伺服器的運作主體是主機硬體層,在自動化的資訊維運理念上是降低人力成本
提昇維運能力與預警處置的最佳運作模式
在伺服器的監控設計上有多種偵測項目的功能,"磁碟陣列"就是其中一種
磁碟陣列系統的監控項目包含有磁碟陣列卡與實體硬碟機的監控
以自動化檢測輔助傳統的以燈號判斷伺服主機狀態的情況
資訊維運系統的"磁碟陣列"功能,其偵測目的為即時掌控磁碟陣列卡(RAID)與實體磁碟機之安全指標與設定狀態
可預警式更換不穩定之磁碟,尤其是屬於虛擬主機的VMhost,則會一次影響多台伺服主機,可見其重要性
從人工巡視機房轉變為自動化檢測機制後檢查次數提昇100倍
使用人工的方式每天巡視機房,從燈號看伺服器的硬體狀態,成為系統維護人員的重要工作之一
其中具代表性的伺服主機重要燈號指標如下:
*.伺服器主體硬體狀態的燈號指示
*.伺服器內有主機板的溫度感測器,散熱風扇,電壓電流以及電源供應器等裝置
*.磁碟陣列(RAID)-磁碟陣列中重要的裝置有磁碟陣列卡與實體硬碟機
由上述可知磁碟陣列的燈號狀況,一直也是維運管理員在管理磁碟陣列時的一個重要指標
所以Watchdog資訊維運系統將"磁碟陣列"納入伺服器的維運項目內
用自動化的檢測系統以拹助IT部門達到最快速與全面性的監控與支援
當異常事件發生時可以馬上通知維運人員,若使用人工方式將會等到嚴重故障事件發生時才會知道,
也無法達到預警機制,更沒有數據與訊息的輔助,僅能憑系統人員的經驗或用猜的方法來排除故障,
尤其是虛擬主機,則會有更大影響,因為多台的Guest主機依附著Host主機並且提供服務
當異常發生時所產生的資訊災害會比一般的實體主機來的更嚴重.
上圖為磁碟陣列的圖形監控首層
由上一段說明可以知道,磁碟陣列的偵測,在伺服主機的管理上占了非常重要的一個環節
維運系統的"磁碟陣列"功能在設計上是嚴謹而詳細,監測目標包含如下:
*.磁碟陣列卡與記憶體狀態,電池狀態
*.磁碟陣區
*.邏輯磁碟區
*.實體磁碟機
*.磁區讀寫錯誤
*.預警式故障
*.磁碟重整(Rebuild)
*.新增磁碟陣列卡/磁碟陣區/邏輯磁碟區/實體磁碟機
*.移除磁碟陣列卡/磁碟陣區/邏輯磁碟區/實體磁碟機
磁碟陣列功能可支援多種常用的廠牌,例如下列品牌:
HP Smart Array
Adaptec RAID
LSI MegaRAID
LSI 3ware RAID (storcli)
進入"磁碟陣列"功能的監控畫面,請由偵測狀態的底下伺服主機點選進入之後,選擇磁碟陣列即可,請參閱下圖:
"磁碟陣列"功能同時提供各種不同的資訊,協助維運人員管理伺服主機的磁碟陣列
詳細也可參考系統右上角的使用說明
監控功能可以支援不同廠牌磁碟陣卡混合使用,同時支援一片以上的磁碟陣列卡與多量的
陣列區,邏輯磁碟區與硬碟的監控偵測
下圖為Watchdog系統的磁碟陣列偵測首頁
可以點選偵測首頁畫面的硬碟查看原始資訊,如下圖直接點選
直接展示出偵測硬碟的原始相關資訊,提供管理員進行分析
請由偵測名單->伺服主機->磁碟陣列設定首頁右上角有個紅色問號點進入,即可查看使用說明,內容如下:
磁碟陣列
*.支援不同廠牌磁碟陣卡混合使用
*.支援數量眾多的磁碟陣列卡、陣列區、邏輯磁碟區與硬碟的偵測
啟用磁碟陣列偵測
1. 請先安裝磁碟陣卡支援的"CLI命令" (Microsoft Windows版本己預設安裝)
如:
HP Smart Array ->hpacucli
Adaptec RAID ->arcconf
LSI MegaRAID ->MegaCli
LSI 3ware RAID ->storcli
各廠牌伺服器內的常用磁碟陣卡
HP ->HP Smart Array
IBM ->Adaptec RAID,LSI MegaRAID,LSI 3ware
DELL ->LSI MegaRAID,LSI 3ware
Intel ->LSI 3ware RAID
磁碟陣列依不同的廠牌對正常與異常有不同的訊息定義
磁碟陣列廠牌型號 HP Smart Array
邏輯磁碟區的使用狀態訊息
正常的訊息
OK ->很好
異常的訊息
Failed Physica Drive ->故障或HD己移除
Recovering,5%complete ->重建中
ReadyforRebuild ->己重建
實體磁碟機的使用狀態訊息
正常的訊息
OK ->很好
異常的訊息
Failed ->故障或己移除
正常應用狀態的訊息
Data Drive ->使用中的實體磁碟機
Spare Drive ->備用的實體磁碟機
Unassigned Drive ->未定義的實體磁碟機
異常應用狀態的訊息
Rebuilding (重建中)
磁碟陣列廠牌型號 Adaptec RAID
邏輯磁碟區的使用狀態訊息
正常的訊息
Okay ->可以,不錯,很好
異常的訊息
Critical ->危急
實體磁碟機的使用狀態訊息
正常的訊息
Online ->使用中的實體磁碟機
Offline ->未使用的實體磁碟機
HotSpare ->備用的實體磁碟機
異常的訊息
Rebuilding ->重建中
Defunct ->死的,已移除
磁碟陣列廠牌型號 LSI MegaRAID
邏輯磁碟區的使用狀態訊息
正常的訊息
Optimal ->正常
異常的訊息
Degraded ->己降級 (可能正在Rebuild中)
Clearing ->清除(正在做 Rebuilding 首次init RAID)
Critical ->危急
實體磁碟機的使用狀態訊息
正常的訊息
Online ->使用中的實體磁碟機
HotSpare ->備用的實體磁碟機
Unconfigured(good) ->未定義->正常
異常的訊息
Rebuild ->重建中
Unconfigured(bad) ->未定義->故障
磁碟陣列廠牌型號 LSI 3ware RAID (storcli)
邏輯磁碟區的使用狀態訊息
正常的訊息
Onln ->正常
異常的訊息
Dgrd ->Degraded 己降級 (可能正在Rebuild中)
Rbld ->Rebuild 重建中
實體磁碟機的使用狀態訊息
正常的訊息
Onln ->Online 使用中的實體磁碟機
GHS ->Global Hotspare 備用的實體磁碟機(共用)
DHS ->Dedicated Hot Spare 備用的實體磁碟機(專用)
UGood ->Unconfigured Good ->未定義->正常
異常的訊息
Offln ->Offline 離線中的實體磁碟機
Rbld ->Rebuild 重建中
UBad ->Unconfigured Bad ->未定義->故障
storcli 專用名稱說明
DG/VD 邏輯磁碟區的使用狀態訊息
DG=Disk Group Index
Arr=Array Index
Row=Row Index
EID=Enclosure Device ID
DID=Device ID
Type=Drive Type
Onln=Online
Rbld=Rebuild
Dgrd=Degraded
Pdgd=Partially degraded
Offln=Offline
BT=Background Task Active
PDC=PD Cache
PI=Protection Info
SED=Self Encrypting Drive
Frgn=Foreign
DS3=Dimmer Switch 3
Dflt=Default
Msng=Missing
FSpace=Free Space Present
PD/HD 實體磁碟機的使用狀態訊息
EID=Enclosure Device ID
Slt=Slot No.
DID=Device ID
DG=DriveGroup
DHS=Dedicated Hot Spare
UGood=Unconfigured Good
GHS=Global Hotspare
UBad=Unconfigured Bad
Onln=Online
Offln=Offline
Intf=Interface
Med=Media Type
SED=Self Encryptive Drive
PI=Protection Info
SeSz=Sector Size
Sp=Spun
U=Up
D=Down
T=Transition
F=Foreign
UGUnsp=Unsupported
UGShld=UnConfigured shielded
HSPShld=Hotspare shielded
CFShld=Configured shielded|
Cpybck=CopyBack|
CBShld=Copyback Shielded
與原廠的資訊狀態同步是維運系統資訊取得重要的指標
磁碟陣列的狀態訊息是使用原廠所提供的CLI命令取得,以確保資料狀態的準確性
週邊項目的設定如下:
*.磁碟陣列
*.標記本機無磁碟陣列
*.磁碟陣列-CLI命令
*.邏輯磁碟區掛載
*.實體磁碟安裝記錄
其中的第一項標記本機無磁碟陣列功能,為選擇開啟與關閉的開關式選項
在初始安裝Watchdog系統的代理程式時為開啟之狀態,如果被偵測目標主機不需要此偵測功能
可點選要關閉之按鈕進行關閉的動作,本功能設計的原因是當確認伺服主機本身沒有磁碟陣列時,
可使用本功能進行關閉以減少主機資源的浪費
如下圖選擇RAID卡廠牌之後點選啟用,如此在磁碟陣列的偵測項目,連結才會取的到資訊:
在RAID卡廠牌的選項中,有如下的選擇:
*.HP Smart Array
*.HP Smart Array 64bit
*.Adaptec RAID
*.Adaptec RAID 64bit
*.LSI MegaRAID
*.LSI MegaRAID 64bit
*.LSI 3ware/MegaRAID
*.LSI 3ware/MegaRAID 64bit
如要啟用磁碟陣列偵測功能,請務必選擇對應的廠牌,並點選儲存即可點選到磁碟陣列偵測功能設定主畫面進設定
在選擇主畫面設定的右上角,有個紅色問號,可以點選進入參考使用方式:
以下為使用說明的內容,請詳細閱讀與參考:
磁碟陣列會因伺服器廠牌,型號而安裝不同的磁碟陣列卡
不同的磁碟陣列卡會用原廠所屬的CLI命令(command line)來取得磁碟狀態
如:
HP -> hpacucli (HP Smart Array)
IBM -> arcconf (Adaptec RAID)
DELL -> megacli (LSI MegaRAID)
磁碟陣列卡廠牌可多選
. Unix,Linux,FreeBSD ...等系統
程式路徑(PATH)若是在 /usr/bin,/usr/sbin,/bin/sbin 預定之執行路徑(set PATH)內可不用輸入
非系統預定執行路徑 例如:/usr/local/bin
. Microsoft Windows 系統
程式路徑(PATH)若是在 \WINDOWS\system32 ..等 預定之執行路徑(set PATH)內可不用輸入
非系統預定執行路徑 例如:c:\msutl
邏輯磁碟區掛載與實體磁碟安裝記錄
本項次為邏輯磁碟區掛載的偵測畫面,點選進入即可進入,如下圖:
本項次為實體磁碟安裝記錄的偵測畫面,點選進入即可進入,如下圖:
邏輯磁碟區掛載與實體磁碟安裝記錄
這兩項選項的設計目的,就是提供維運管理者在使用磁碟陣列偵測功能時,另一個詳細的數據連結
提供以下的項次給維運管理者參考與使用.
邏輯磁碟區掛載
*.CLI名稱
*.陣列卡號
*.廠牌型號
*.硬碟編號
*.硬碟介面
*.硬碟型號
*.硬碟容量
*.應用狀態
*.使用狀態
*.掛載位置(/home2)
*.驅動位置(/dev/cciss/c0d2)
實體磁碟安裝記錄
*.CLI名稱
*.陣列卡號
*.廠牌型號
*.硬碟編號
*.硬碟介面
*.硬碟型號
*.硬碟容量
*.應用狀態
*.使用狀態
*.硬碟安裝時間yyyy/mm/dd
*.保固年限
回到首頁